Convex Hull - Part 3

2018年3月13日 · 阅读需 8 分钟

这次继续介绍几个凸包算法，包括 Graham scan 和快速凸包算法。

Graham scan

Graham scan 是一个表达起来很简洁的算法，而且也没有涉及到复杂的数据结构，它仅仅需要两个栈 $S$ 和 $T$ 。

首先遍历所有点，选出 lowest-then-leftmost 的点 $p_{1}$ ，并以该点为参照，将所有其余点按照极角排序，分别为 $p_{2},p_{3},\cdots ,p_{n}$ 。

两个栈初始化为（方括号代表栈底）： $S=[\ p_{1},p_{2}>$ $T=< p_{3},p_{4},\cdots ,p_{n}\ ]$

扫描算法流程：当栈 $T$ 非空时，如果栈 $T$ 的栈顶在栈 $S$ 的栈顶与次栈顶组成的有向边的左侧，则将栈 $T$ 的栈顶压入栈 $S$ ；否则弹出栈 $S$ 的栈顶元素。伪代码如下：

while (!T.empty())
    toLeft(S[1], S[0], T[0]) ? S.push(T.pop()) : S.pop();

有兴趣的读者可以在下图所示的点集上运行一遍算法流程，我就不赘述了。

graham-scan-1

扫描效率

这一节讨论扫描一步的效率。粗浅来看，点集中除了参照点的每个点都可能被做 $\Omega(n)$ toLeft 比较，那么扫描效率就是 $O(n)\times O(n)=O(n^{2})$ 。但这种估计方法明显太松了，接下来用两种方法求更紧的上界。

平面图

先来复习一下图论中平面图的概念：

在图论中，平面图是可以画在平面上并且使得不同的边可以互不交叠的图。而如果一个图无论怎样都无法画在平面上，并使得不同的边互不交叠，那么这样的图不是平面图，或者称为非平面图。

而在扫描一步中，遍历的所有边都不会相交（如下图）。也就是说，这一步的搜索空间构成了一个平面图。根据欧拉定理，得知平面图中边数 $E=O(3n)$ ，从而说明了扫描效率为 $O(n)$ 。

graham-scan-2

均摊分析

我们从另一方面看待这个问题，考虑变量 $A=|S|+2|T|$ 。显而易见地，每次循环中 $A$ 都会减少 $1$ 。扫描开始时， $A=2n-2$ ；扫描结束时， $A\ge 3$ 。则循环执行了 $O(2n-5)=O(n)$ 次，也即扫描效率为 $O(n)$ 。

简化

仔细想想，算法中的排序一步是不需要 toLeft 作为比较器的。

假如在点集中增加一个点作为参考点，并把它无限拉低，直到 $(0,-\infty)$ ，则点集中其余点与参考点连成的线就是竖直的，也就是说，我们只需要对其余点的横轴坐标排序即可。

但由于引入了一个新的点，所以也会导致求得的凸包与原点集凸包不符。幸运的是，如果我们将新凸包中与参考点有关的两条边删掉，就可以得到原凸包的上半部分，称之为上半凸包（upper hull）。

同理，可以在点集中增加参考点 $(0,+\infty)$ ，就可以求出下半凸包（lower hull）。将两者合并，就得到了原凸包。

极点个数期望

令 $P$ 是平面上的点集，假设点的个数是 $n$ ，这一节将讨论 $CH(P)$ （P的凸包）上点个数的量级。

值得注意的是，不同的采样方式会得出不同的结果。考虑在单位正方形内均匀且独立地采样（单位正方形与任意长方形是相同的，因为两者可以通过仿射变换至彼此）。

取凸包的最上/下/左/右四个点，可以将凸包分成四个部分，不失一般性，我们只考虑凸包的右上角 $CH_{UR}(P)$ ，如下图。

expection-complexity-1

在右上角区域，可以定义「极大点」：

以点 $P$ 为原点建立坐标系，如果第一象限没有点集中的其余点，则称点 $P$ 为极大点。

expection-complexity-2

称极大点集为 $MAX(P)$ ，则 $|CH_{UR}(P)|\le |MAX(P)|$ ，接下来考虑 $|MAX(P)|$ 的期望。

从右到左，将点集中的点称之为 $\{p_{1},p_{2},\cdots ,p_{n}\}$ 。对于点 $p_{k}$ 来讲，它是极大点当且仅当它是 $\{p_{1}, p_{2}\cdots ,p_{k}\}$ 中最高的。由于点是在单位正方形内均匀独立采样得到的，则 $p_{k}$ 是极大点的概率为 $\frac{1}{k}$ 。故

$E[|MAX(P)|]=\sum_{i=1}^{n} \frac{1}{n}=O(\log(n))$

经过上述推导，得知当在单位正方形内均匀独立采样时，凸包上点个数的期望为 $O(\log(n))$ 。

除了在单位正方形内采样以外，在其他几何形状内采样则会得到不同的结果：

单位圆 —— $O(n^{\frac{1}{3}})$ ；
三角形 —— $O(\log(n))$ ；
凸 $k$ 多边形 —— $O(k\log(n))$ 。

快速凸包（Quickhull）

首先找出点集中 leftmost-then-lowest 的点 $s$ ，以及 rightmost-then-highest 的点 $t$ 。则求解凸包就可以分为求解上半凸包和下半凸包，如下图。

quickhull-1

由于求解上下半凸包是对称的，所以只讨论上半凸包的求解过程。

与快速排序类似，在每次求解凸包时，都将当前点集分为三部分：

$P_{0}$ 区域是需要被剪掉的部分，这其中的点之后无需考虑；
$P_{1},P_{2}$ 区域为左、右子区域，原凸包可以由这两个子区域的凸包组合而成。

具体来说，取距离线段 $st$ 最远的点 $r$ 作为哨兵。那么 $\triangle srt$ 包围的区域则为 $P_{0}$ ， $sr$ 左侧的区域是 $P_{1}$ ， $rt$ 右侧的区域是 $P_{2}$ ，如下图。

quickhull-2

当然快速凸包算法的最差情况也是 $O(n^{2})$ 的，考虑这种情况：在单位圆的直径上取两个点，随后在圆心角为 $\frac{90^{\circ}}{2^{k}},k=0,1,2,\cdots$ 的位置加入点，如下图。那么每次选择哨兵时都会造成左右极不均匀，从而导致最坏情况。

quickhull-3

Graham scan​

扫描效率​

平面图​

均摊分析​

简化​

极点个数期望​

快速凸包（Quickhull）​

Graham scan

扫描效率

平面图

均摊分析

简化

极点个数期望

快速凸包（Quickhull）